通用数据防泄漏的关键技术有哪些
通用数据防泄漏的关键技术有以下这些:
关键字技术:关键字检测能够匹配任何字词或短语,包括那些使用任何常见字词分隔符(例如空格、逗号、短横线或斜杠)的字词或短语。用户可为每个条件的关键字匹配进行区分大小写的配置。也可以单独为每个条件配置可定义管事件的匹配关键字或关键短语的数量。
标识符技术:标识符技术可以准确标识基于模式的敏感数据,例如信用卡号、社会安全号或驾驶执照号码。数据标识符使用的检测算法结合了模式匹配和其他准确性检查和验证,例如对信用卡号的检查。与其他仅使用正则表达式识别模式的解决方案不同,数据标识符还包括有关不同数据类型的有敁数字范围的内置信息。通过此额外信息,客户可以筛选出测试数据和其他常见误报,并识别特定于广泛的行业、国家/地区和区域的数据类型,包括信用卡号、支付卡行业 (PCI) 数据安全标准的磁条数据、银行标识号码 (BIN)、国家保险号码。
文件识别技术:在开始分析内容之前,首要的一个工作就是对文件进行正确的识别和处理,把文件中的文字提取出来进行后续的处理。还能对文字进行自然语义分析和处理,留出其中的关键字来进行处理。文件识别的最大难度在于支持文件类型的广泛性和正确性,而天空卫士DLP以其高性能的处理引擎都能最大化的正确识别并进行分析和处理。
数字指纹技术:数字指纹技术分为结构化指纹技术(EDM)和非结构化指纹技术(IDM)。EDM 用于保护通常为结构化格式的数据,例如客户或员工的数据库记录。IDM 用于保护非结构化数据,例如 Microsoft Word 或 PowerPoint 文档,或 CAD 绘图。对于EDM 和 IDM,都是首先由组织标识机密数据,然后由策略管理平台 对这些数据进行指纹加密以进行持续的精确检测。指纹加密过程包管理平台访问和提取文本和数据,对其进行规范化,然后使用不可逆哈希为其提供保护。可以将策略管理平台 配置为定期自动为EDM 或 IDM 文件编制索引,仍而使这些数据配置文件始终保持最新状态。这种检测方法的基础是使用常见特征查找数据,这些特征有关键字、正则表达式、已验证数据类型、文件类型、文件大小、文件名和收件人/收件人/用户组合等。网络 DLP 检测基于实际的敏感内容,而非文件本身。因此,网络 DLP 不仅可以检测敏感数据的提取信息或衍生信息,而且还可以识别采用指纹加密信息之外的其他文件格式的敏感数据。例如,如果一份仹Microsoft Word 机密文档经过指纹纹加密,即使该内容作为 PDF 附件通过电子邮件收送,网络DLP依然可以可准确检测到它。
机器学习技术:机器学习可以对大量的无特定格式文件样本进行快速学习和分类,分类产生的模型(Model)可用来对数据进行分析并计算该数据是否属于某一个分类。机器学习的优势在于其生成的模的大小基本恒定,所以很适合处理大量的样本,另外机器学习技术可以对新的、并未出现在样本中的数据进行较为准确的预测。
图像识别技术:DLP安全策略分析引擎对图片、打印文件等提取文字并执行安全策略检查,无论是网络、邮件、还是存储通道。进行光学字符识别内容分析,特别适用于网络传输、数据发现以及打印服务器的信息泄露。